# python程序在运行对的时候

# 为了方便程序计算 字符串在内存里面都会转换为 unicode吗 固定长度的 0 - 1 二进制

# GB 国标码 存储在硬盘上的编码格式  GB18010 GBK 网页上用的最多
# 中文 16位 英文 8位 -> ascii码

# utf 可变长度对的 unicode的码
# utf-8
# 字母 一个字节
# 欧洲文字 两个字节
# 中文 三个字节
# 世界上所有的文字都可以用utf-8来表示
# 编码 encode
# 解码 decode
# 编码
# s = "中国"
# print(s.encode("utf-8")) # 编码
# print(s.encode("gbk")) # 编码
# 解码

s = "中国"
print(s.encode("utf-8")) # 6个字节

# 结论GBK 一个汉字2个字节 utf-8 一个汉字3个字节

s = b"\xe4\xb8\xad\xe5\x9b\xbd"
print(s.decode("utf-8"))